21 research outputs found

    Temps dans le cycle de vie du document numérique (Le)

    Get PDF
    Intervention au colloque "Le numérique : impact sur le cycle de vie du document", organisé à l\u27université de Montréal par l\u27EBSI et l\u27ENSSIB du 13 au 15 octobre 2004. Cet article propose une modélisation capable de rendre compte des différentes dimensions temporelles portées par un document. Après la définition de la notion de document, nous introduisons trois univers : l\u27univers sociohistorique, l\u27espace documentaire et l\u27univers du discours. Chacun d\u27eux contient sa propre dimension temporelle

    Numérique : impact sur le cycle de vie du document (Le)

    Get PDF
    Actes du colloque "Le numérique : impact sur le cycle de vie du document" organisé à l\u27université de Montréal par l\u27EBSI et l\u27ENSSIB du 13 au 15 octobre 2004. Son objectif était de traiter de façon interdisciplinaire la problématique suivante : « La numérisation, la diffusion des formats numériques originaux, les nouvelles méthodes d\u27indexation et d\u27analyse du document ainsi que le fonctionnement en réseau changent les données de base de la vie du document qui devient une sorte de phénix incessamment renaissant » (programme du colloque)

    Analyse syntaxique automatique du français écrit : applications à l'indexation automatique

    Get PDF
    Natural language parsing consists in defining a grammar, necessarily ambiguous, choosing a non deterministic parsing algorithm and working out a parsing strategy in order to avoid build parasite structures. In this thesis, we define a context free grammar for french noun phrases. We study two non-deterministic parsers : Cocke-Younger-Kasami's and Early's parsers. On the Early's algorithm we propose a prediction parsing algorithm based on the linguistic data included in the input string. Automatic indexing of documents by noun phrases extracted from abstracts is presented as a potential application of this parserL'analyse syntaxique d'une langue naturelle consiste à définir une grammaire de cette langue, grammaire nécessairement ambiguë, à choisir un algorithme d'analyse non déterministe et à élaborer une stratégie d'analyse afin d'éviter la construction de structures syntaxiques parasites. Dans le cadre de ce travail, nous définissons une grammaire du syntagme nominal du français écrit. Nous étudions les analyseurs hors contexte et non déterministes de Cocke-Younger-Kosomi et d'Earley, et retenons ce dernier. Puis, au dessus de cet analyseur, nous élaborons une stratégie d'analyse qui, à partir des données linguistiques portées par le texte à analyser, permet de prédire localement la structure juste et qui limite de ce fait le nombre de solutions parasites. L'indexation automatique de documents à partir des syntagmes nominaux contenus dans leur résumé est une application de l'analyseur construi

    Recherche documentaire et traitement de l'information

    No full text
    Information retrieval is not only a question addressed to computer scientists. It is a human activity involving technical devices, knowledge representation. This chapter deals with the basements of research in this area in the field of information and communication sciencesLa recherche d'information n'est pas le domaine réservé de l'informatique. C'est une activité humaine mettant en jeu des dispositifs techniques, des représentations des savoirs, des logiciels. Ce chapitre positionne la recherche d'information dans le champ des sciences de l'information et de la communicatio

    Évolution des traitements informatiques et linguistiques pour la recherche d'information. Retour critique sur la place des techniques et des technologies en SIC

    No full text
    This chapter deals with resarch works evolutions, through last fifty years, in the field of natural language processing towards information retrieval. Three stages are pointed : the former, until 1980, where linguistic and quantitative methods are opposite, the second, until 1995, where all the disciplines are sollicited and lead to hybridation of methods ; this stage of pre-industrialisation ended with campaign of evaluation of such methods ; the latter is characterized by industrialization.Ce chapitre retrace les évolutions sur les 50 dernières années des travaux de recherche dans le domaine du traitement automatique des langues pour l'indexation et la recherche d'information. Il met l'accent sur trois grandes étapes : la première jusqu'en 1980, qui se partage entre les méthodes linguistiques et les méthodes quantitatives, la deuxième jusqu'en 1995 qui s'ouvre à toutes les disciplines et où les méthodes s'hybrident, et conduisent à des campagnes d'évaluation, la dernière qui est celle de l'industrialisation, mettant fin aux travaux de recherche académique

    De l'édition traditionnelle à l'édition numérique : le cas de la presse du XIXème siècle

    No full text
    International audienceSome projects which consist in a digital reedition of ancient newspapers collections, are analysed through following aspects : functionalities, uses, objectives. Furthermore, this paper suggests some new questions arised from digital reedition : actors, objectives, economical models..

    Une nouvelle lecture de la structure d'un document en vue de la construction d'index

    No full text
    La structure du document technique, objet de consultation à des fins opératoires est analysée suivant toutes ses dimensions : les liens entre texte et graphique, le plan du document, les éléments du paratexte (sommaire, index). De cette analyse, il convient de proposer une structure d'index conforme aux usages de ce type de documents

    L'accès au patrimoine écrit en ligne : analyse structurelle et réflexion prospective sur un cas français

    No full text
    this paper presents results of a structural analysis on digital reedition of a specific patrimonial object : regional press of the nineteeth century.Cet article présente les résultats d'une analyse structurelle menée sur la réédition numérique d'un type particulier de patrimoine écrit - la presse locale du XIXe siècle. Il expose la multiplicité des variables concourant à modeler le devenir de l'accès numérique au patrimoine écrit : ce dernier est à penser dans un temps long, et repose autant sur des avancées technologiques, sur des variables organisationnelles et juridiques, que sur les représentations et les pratiques que les institutions communicantes construisent autour des évolutions du web, de leurs missions, de leurs usagers, et des objets du patrimoine

    Collections de presse, numérisation et patrimoine des bibliothèques

    No full text
    Press collections, digitization and library heritage. The emergence and evolution of the “cultural heritage in libraries” as a concept are examined in this paper, through the study of legislatives devices, professional practices, and tools such as collective catalogs. While initially only rare and precious books were considered as heritage objects, today the cultural heritage status extends to the collections built up by these institutions. Furthermore, in the past, the major concern for heritage objects in libraries was conservation rather than dissemination, but today, thanks to digitization, these objects can be read on a screen. In this text, we analyze the case of the bibliothèque municipale de Lyon (the public library of Lyon), which now publishes its 19th century newspaper collection online.L’émergence et l’évolution de la notion de «patrimoine des bibliothèques» françaises sont étudiées au travers des dispositifs législatifs, des pratiques professionnelles et des outils comme les catalogues collectifs. Alors qu’initialement seuls les ouvrages rares et précieux étaient les objets patrimoniaux, la valeur patrimoniale s’étend aujourd’hui aux collections constituées par ces institutions. Par ailleurs, les objets patrimoniaux dans les bibliothèques, jusqu’alors plus enclins à la conservation qu’à la diffusion, peuvent maintenant se donner à lire à l’écran grâce à leur numérisation. Le cas particulier de la bibliothèque municipale de la Part-Dieu à Lyon, qui diffuse ses collections de presse du XIXe siècle sous format numérique, est analysé.Colecciones de prensa, digitalización y patrimonio de las bibliotecas. La emergencia y la evolución de la noción de “patrimonio de las bibliotecas” son estudiadas a través los dispositivos legislativos, las prácticas profesionales y herramientas como los catálogos colectivos. Mientras que inicialmente solamente las obras raras y preciosas eran los objetos patrimoniales, el valor patrimonial se extiende a las colecciones constituidas por estas instituciones. Por su parte, los objetos patrimoniales en las bibliotecas que eran hasta entonces más propensos a la conservación que a la difusión, ahora pueden ser leídos en la pantalla gracias a la digitalización. Se analiza el caso particular de la biblioteca municipal de la Part-Dieu, Lyon, que difunde sus colecciones de prensa del siglo diecinueve en formato digital.Lallich-Boidin Geneviève, Brun-Picard Céline. Collections de presse, numérisation et patrimoine des bibliothèques. In: Culture & Musées, n°21, 2013. pp. 89-110
    corecore